赋能你的手机、你的家、你的车,DuerOS 唤醒万物的盘子可能比你想象还要大
- shenzhenware -
4 个月前,当景鲲喊出这一句口号时,许多人觉得这只是巨头自信心过剩的大话。然而短短 4 个月里,DuerOS 新增 130 余家合作伙伴、落地硬件解决方案超过 20 个、每月有 5 款以上搭载 DuerOS 的设备推出……DuerOS 迭代平台、整合生态、将对话式 AI 能力进行产品化落地的速度,让怀疑的声音很快安静下来。
11 月 16 日召开的「百度世界大会 2017 」上,DuerOS 发布了全面升级的 DuerOS 2.0 对话式 AI 操作系统,并相继推出了一系列推进产业链变革和产学研联动的措施。
▎对话核心系统:让设备更智能,用户体验更好
在智能音箱这个新兴的消费产品市场,许多人工智能产品被诟病为「人工智障」,究其原因还是人机交互设计和智能化程度的不成熟。DuerOS 要赋能万物,成为世界级 AI 系统的标杆,必须提升自身交互体验的能力,拔高全行业最高水平,同时推高行业平均水平。
联合渡鸦,发布三款搭载 DuerOS 2.0 的硬件产品,打造软硬一体化设备标杆。图为 raven R 六轴情感机器人。
这一版升级的 DuerOS 2.0 系统,在核心技术能力层面,提升了准确快速的语音唤醒能力、流畅自然的语音识别能力、生动鲜活的合成语音、以及更加丰富的 AI 能力。
在语音唤醒能力方面,实现了一句联控、任意打断、波束成形、噪声抑制、混响抑制、阵列增益、回声抵消。其中,无间断唤醒、清唱识曲,这两项用户使用频率较高的设备能力,在这一版有了较好的表现。
在语音识别能力方面,百度的上亿级近场数据,为远场设备做了调优铺垫,识别准确率有了大幅度的提升。高频词做了全面优化,中英文、多种说话方式和口音的一体化建模,大大降低了设备的误识别率。在语音语义一体化识别上,也更加流畅。
在合成语音能力方面,DuerOS 基于深度学习的情感拼接合成,全新定制的高度拟人化的合成音,「小度」的声音将更加生动鲜活。
除此之外,新版 DuerOS 还集成了包括人脸识别、图形识别、音频旋律匹配与检测技术、大数据控制与分析技术等更加丰富的 AI 能力,为智能设备的功能扩展预留空间。
用户体验是对话式人工智能生态系统的核心。DuerOS 希望达到的效果,是能让用户在不同的场景下,能够自然的使用设备、并且习惯一直使用这个设备,并让用户越来越习惯智能化的生活。
DuerOS 的智能家居体验间
▎智能设备开放平台:加快赋能硬件设备
在过去的几个月里,DuerOS 不停歇地推动着搭载 DuerOS 能力的硬件设备陆续落地。一方面,我们看到了包括中信国安广视、小鱼在家、海尔、美的、联想、哈曼、TCL、极米、小天才等众多知名企业与 DuerOS 的品牌联合;另一方面,DuerOS 也在将对话能力应用到手机、电视、音箱等智能家居、智能穿戴和车载场景中。
为了更快的推进各行各业的赋能,DuerOS 在解决方案方面也进行了全面升级,包括更好的远场语音交互开发套件、全新的语音交互 App 解决方案、全新的 DuerOS for Apollo 解决方案、以及全新的跨场景跨设备解决方案。
李彦宏在百度世界大会上通过手机百度,在语音播报新闻信息流内容时,用自然语言交互进行播报控制及深度信息挖掘的体验展示,正是基于 DuerOS 2.0 提供的语音交互 App 解决方案。
除此之外,DuerOS 还对平台体系进行了升级,包括新增的物联网设备云、智能设备质量认证支持,平台体系更加丰富。
搭载 DuerOS 的智能手机 HTC U11,图片来源:爱搞机
▎技能开放平台:让设备拥有更丰富的内容、服务、和特定场景的对话能力
4 个月前,我们在做语音技能的深度报道时,还需要通过 App 开发做类比,以阐述技能的概念,并渲染在 AI 时代,语音技能开发的未来前景。然而不到半年的时间,国内厂商陆续发布了各自的语音技能平台。人们对于技能关注的目光,也逐渐从「是什么」、「为什么」,转向「怎么做」。
百度自己评价对话式 AI 产品体验的核心指标是听清、听懂与满足能力,其中的满足就体现在内容及服务生态的丰富度上。DuerOS 已经可以提供 10 大类、超过 100 项原生技能给用户,让用户体可以体验包括影音娱乐、信息查询、出行路况、聊天休闲、生活服务等技能。
为了让用户享受到丰富多彩的技能,DuerOS 不仅大幅提升了原生技能的丰富度与用户体验,还发布了小度技能开放平台,兼容了 UNIT、ChatFlow、STOR/AOR、ruyi 等多种技能开发工具,让开发者借助平台,真正实现「一站式」、「零门槛」的语音技能开发。
目前,DuerOS 的技能生态已拥有超过 100 个原生技能和 100 个第三方技能。未来,将会有更多诸如成语接龙、星座运势、饮食百科的语音技能上线 DuerOS 技能商店。
▎推动对话式人工智能在产、学、研三方面全面发展
要成为世界级人机交互的标杆,更好的推动行业发展和更优秀的产品体验,DuerOS 可以做的更多。
对话式 AI 技术正在重新定义人机交互的方式。为引领和定义最好的人机交互,DuerOS 成立了百度人工智能交互设计院,未来将以报告输出、产品测评等形式,帮助 DuerOS 的合作伙伴和全球 AI 产品在交互设计上不断提升优化。
同时,为了进一步提高对话式 AI 领域的技术领先优势,DuerOS 最新的普罗米修斯计划正式起航,这个计划包含开放超大规模对话式 AI 数据集、跨学科合作等多种计划,以及一个 100 万美元的基金用以鼓励和培养对话式 AI 领域的优秀项目和人才。
DuerOS 将推动对话式人工智能在产、学、研三方面全面发展。唤醒万物、全面领跑语音智能行业的 DuerOS 将最有能力成为那个为智能创造更多可能的平台。
图片来源:11/16 日百度世界大会景鲲演讲 PPT
▎展望
过去的 4 个月,是整个语音智能行业特别突飞猛进的 4 个月。国外,Google 推出了智能音箱全家桶,亚马逊发布了二代 Echo 并推进 Alexa 技能付费政策,苹果供应商爆料 HomePod 将搭载 Face ID,Sony 等厂商也相继推出带屏幕的智能音箱。这些都是特别好的信号,巨头推动产业变革的速度,总能超出人们的想象。
国内,一个双 11 将百箱大战推到了一个新高度。产品公司积极的向普通消费者普及智能音箱,在家里、在车上、在酒店,场景化的对话式人机交互已经无处不在。另一方面,平台公司则面向开发者,相继开放了自己的语音智能平台能力,开发者申请开发板和参与技术沙龙的热情高涨。整个行业保持的这种热情,推动着人机交互的变革走进每一个家庭,让对话式 AI 成为一个生活必需品。
这是一个最好的时代。要成为时代的领跑者,不仅要成为披荆斩棘的创新者和开拓者,更需要成为纵横捭阖的整合者。百度是国内最早进入、最大投入、最完整布局的 AI 公司。作为百度 AI 能力和资源集大成者的一个缩影,以及对话式人工智能的一个缩影,DuerOS 充分发挥了可以贯穿技术、产品、平台、生态的垂直整合能力。
我们期待着 DuerOS 能为整个语音智能行业带来的勃勃生机。■
主笔:陈壹零@深圳湾
· ● 推荐阅读 ● ·
// DuerOS 大事件 //
DuerOS 唤醒之旅深圳站 | DuerOS 唤醒之旅北京站
// 行业深度解读 //
// DuerOS 应用案例 //
· ● 深圳湾招人啦!● ·
深圳湾招人啦!!!深圳湾正在寻找以下才子佳人:「真知灼见的科技记者」、「才华横溢的运营编辑」、「技能爆表的活动策划」、「热情四射的实习编辑」。如果你对科技领域有满满的热情、想把玩最新最酷的科技产品、喜欢分享一切有趣科技成果,那就快到「湾」里来吧!
简历传输门👉 s@shenzhenware.com
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。